智能论文笔记

A dual benchmarking study of facial forgery and facial forensics

Minh Tam Pham , Thanh Trung Huynh , Van Vinh Tong , Thanh Tam Nguyen , Thanh Thi Nguyen , Hongzhi Yin , Quoc Viet Hung Nguyen

分类：计算机视觉

2021-11-25

近年来，视觉伪造达到了人类无法识别欺诈的复杂程度，这对信息安全构成了重大威胁。出现了广泛的恶意申请，例如名人的假新闻，诽谤或勒索，政治战中的政治家冒充，以及谣言的传播吸引观点。结果，已经提出了一种富有的视觉验证技术，以试图阻止这种危险的趋势。在本文中，我们使用全面的和经验方法，提供了一种基准，可以对视觉伪造和视觉取证进行深入的洞察。更具体地，我们开发一个独立的框架，整合最先进的假冒生成器和探测器，并使用各种标准来测量这些技术的性能。我们还对基准测试结果进行了详尽的分析，确定了在措施与对策之间永无止境的战争中的比较参考的方法的特征。

translated by 谷歌翻译

Learning to diagnose common thorax diseases on chest radiographs from radiology reports in Vietnamese

Thao T. B. Nguyen , Tam M. Vo , Thang V. Nguyen , Hieu H. Pham , Ha Q. Nguyen

分类：计算机视觉

2022-09-11

我们提出了一个数据收集和注释管道，该数据从越南放射学报告中提取信息，以提供胸部X射线（CXR）图像的准确标签。这可以通过注释与其特有诊断类别的数据相匹配，这些数据可能因国家而异。为了评估所提出的标签技术的功效，我们构建了一个包含9,752项研究的CXR数据集，并使用该数据集的子集评估了我们的管道。以F1得分为至少0.9923，评估表明，我们的标签工具在所有类别中都精确而始终如一。构建数据集后，我们训练深度学习模型，以利用从大型公共CXR数据集传输的知识。我们采用各种损失功能来克服不平衡的多标签数据集的诅咒，并使用各种模型体系结构进行实验，以选择提供最佳性能的诅咒。我们的最佳模型（CHEXPERT-FRECTER EDIDENENET-B2）的F1得分为0.6989（95％CI 0.6740，0.7240），AUC为0.7912，敏感性为0.7064，特异性为0.8760，普遍诊断为0.8760。最后，我们证明了我们的粗分类（基于五个特定的异常位置）在基准CHEXPERT数据集上获得了可比的结果（十二个病理），以进行一般异常检测，同时在所有类别的平均表现方面提供更好的性能。

translated by 谷歌翻译

Physics-based Digital Twins for Autonomous Thermal Food Processing: Efficient, Non-intrusive Reduced-order Modeling

Maximilian Kannapinn , Minh Khang Pham , Michael Schäfer

分类：人工智能

2022-09-07

使热处理可控的一种可能的方法是收集有关产品当前状态的实时信息。通常，感觉设备无法轻松或根本捕获所有相关信息。数字双胞胎在实时模拟中使用虚拟探针缩小了这一差距，并与该过程同步。本文提出了一个基于物理的，数据驱动的数字双框架，用于自动食品处理。我们建议使用设备级别可执行的精益数字双胞胎概念，需要最小的计算负载，数据存储和传感器数据要求。这项研究重点是用于热过程的非侵入性降低模型（ROM）的简约实验设计。在训练数据中表面温度的高标准偏差与ROM测试中的均方根误差之间的高标准偏差之间的相关性（$ r = -0.76 $）可以有效地选择训练数据。最佳ROM的平均均方根误差小于代表性测试集的1 kelvin（0.2％平均平均百分比误差）。 SP $ \ $ 1.8E4的仿真速度允许进行设备模型预测控制。拟议的数字双框架旨在适用于行业。通常，一旦在未提供对求解器的根级访问（例如商业仿真软件）中执行该过程的建模，就需要一旦在软件中执行该过程的建模，就需要进行非侵入式降级建模。仅使用一个数据集就可以实现降顺序模型的数据驱动训练，因为使用相关性来预测训练成功。

translated by 谷歌翻译

Few-shot Object Counting and Detection

Thanh Nguyen , Chau Pham , Khoi Nguyen , Minh Hoai

分类：计算机视觉

2022-07-22

我们解决了一项新的任务，即计数和检测。给定目标对象类的一些示例边界框，我们试图计数和检测目标类的所有对象。该任务与几个弹出对象计数相同的监督，但另外还输出对象边界框以及总体计数。为了解决这个具有挑战性的问题，我们介绍了一种新颖的两阶段训练策略和一种新颖的不确定性 - 少数光对象探测器：计数 - 滴定。前者的目的是生成伪距离界限框来训练后者。后者利用了前者提供的伪基真实，但采取了必要的步骤来解释伪基真实的不完美。为了验证我们在新任务上的方法的性能，我们介绍了两个名为FSCD-147和FSCD-LVIS的新数据集。两个数据集都包含具有复杂场景，每个图像多个对象类的图像，并且对象形状，大小和外观的巨大变化。我们提出的方法优于非常强大的基线，该基线是根据数量计数和少量对象检测而适应的，并且在计数和检测指标中均具有很大的余量。代码和模型可在\ url {https://github.com/vinairesearch/counting-detr}中获得。

translated by 谷歌翻译

Model-Agnostic and Diverse Explanations for Streaming Rumour Graphs

Thanh Tam Nguyen , Thanh Cong Phan , Minh Hieu Nguyen , Matthias Weidlich , Hongzhi Yin , Jun Jo , Quoc Viet Hung Nguyen

分类：人工智能 | 机器学习

2022-07-17

在社交媒体上传播谣言对社会构成了重要威胁，因此最近提出了各种谣言检测技术。然而，现有的工作重点是\ emph {what}实体构成谣言，但几乎没有支持理解\ emph {为什么}实体已被归类为这样。这样可以防止对检测的谣言以及对策设计的有效评估。在这项工作中，我们认为，可以通过过去检测到的相关谣言的例子来给出检测到的谣言的解释。一系列类似的谣言有助于用户概括，即了解控制谣言的探测的特性。由于通常使用特征声明的图表对社交媒体的谣言传播通常是建模的，因此我们提出了一种逐个示例的方法，鉴于谣言图，它从过去的谣言中提取了$ k $最相似和最多的子图。挑战是所有计算都需要快速评估图之间的相似性。为了在流式设置中实现该方法的有效和适应性实现，我们提出了一种新颖的图表学习技术，并报告了实施注意事项。我们的评估实验表明，我们的方法在为各种谣言传播行为提供有意义的解释方面优于基线技术。

translated by 谷歌翻译

Video Dialog as Conversation about Objects Living in Space-Time

Hoang-Anh Pham , Thao Minh Le , Vuong Le , Tu Minh Phuong , Truyen Tran

分类：计算机视觉 | 机器学习

2022-07-08

能够创建一个可以与人类就他们所观看的东西进行有意义的对话的系统，这将是一项技术壮举。针对该目标的设置作为视频对话任务表示，要求系统在正在进行的对话框中对问题产生自然话语。该任务带来了伟大的视觉，语言和推理挑战，如果没有适当的表示方案，可以轻松克服支持高级推理的视频和对话。为了应对这些挑战，我们提出了一个新的以对象为中心的视频对话框架，该框架支持神经推理称为成本 - 代表时空中有关对象的对话。在这里，视频中的动态时空视觉内容首先解析为对象轨迹。鉴于此视频抽象，成本维护并跟踪与对象相关的对话框状态，这些对话框在收到新问题后会更新。对象相互作用是动态和条件地推断出每个问题的，并且它们是它们之间关系推理的基础。成本还保留了以前答案的历史记录，这允许检索相关的以对象为中心的信息以丰富答案形成过程。然后，语言生产以逐步进行，进入当前话语，现有对话和当前问题的背景。我们评估了DSTC7和DSTC8基准的成本，证明了其对最先进的竞争力。

translated by 谷歌翻译

Quantum Neural Architecture Search with Quantum Circuits Metric and Bayesian Optimization

Trong Duong , Sang T. Truong , Minh Tam , Bao Bach , Ju-Young Ryu , June-Koo Kevin Rhee

分类：机器学习

2022-06-28

量子神经网络在嘈杂的中间量子时代的广泛应用方面有希望。因此，对自动量子神经架构搜索的需求不断增长。我们通过设计高斯工艺的贝叶斯优化的量子电路指标来应对这一挑战。为了实现这一目标，我们提出了一个新的量子门距离，该距离距离，以每个量子状态的行动为特征，并就其几何特性提供理论观点。我们的方法极大地超过了三个经验量子机学习问题的基准，包括培训量子生成的对抗网络，在MaxCut问题中求解组合优化以及模拟量子傅立叶变换。我们的方法可以扩展以表征各种量子机学习模型的行为。

translated by 谷歌翻译

Revisiting Self-Distillation

Minh Pham , Minsu Cho , Ameya Joshi , Chinmay Hegde

分类：机器学习

2022-06-17

知识蒸馏是将“知识”从大型模型（教师）转移到更紧凑的（学生）的过程，通常在模型压缩的背景下使用。当两个模型都具有相同的体系结构时，此过程称为自distillation。几项轶事表明，一个自灭的学生可以在持有的数据上胜过老师的表现。在这项工作中，我们系统地研究了许多设置。我们首先表明，即使有一个高度准确的老师，自我介绍也使学生在所有情况下都可以超越老师。其次，我们重新审视了（自我）蒸馏的现有理论解释，并确定矛盾的例子，揭示了这些解释的可能缺点。最后，我们通过损失景观几何形状的镜头为自我鉴定的动态提供了另一种解释。我们进行了广泛的实验，以表明自我验证会导致最小化的最小值，从而导致更好的概括。

translated by 谷歌翻译

An FPGA-based Solution for Convolution Operation Acceleration

Trung Dinh Pham , Bao Gia Bach , Lam Trinh Luu , Minh Dinh Nguyen , Hai Duc Pham , Khoa Bui Anh , Xuan Quang Nguyen , Cuong Pham Quoc

分类：人工智能 | 机器学习

2022-06-09

基于硬件的加速度是促进许多计算密集型数学操作的广泛尝试。本文提出了一个基于FPGA的体系结构来加速卷积操作 - 在许多卷积神经网络模型中出现的复杂且昂贵的计算步骤。我们将设计定为标准卷积操作，打算以边缘-AI解决方案启动产品。该项目的目的是产生一个可以一次处理卷积层的FPGA IP核心。系统开发人员可以使用Verilog HDL作为体系结构的主要设计语言来部署IP核心。实验结果表明，我们在简单的边缘计算FPGA板上合成的单个计算核心可以提供0.224 GOPS。当董事会充分利用时，可以实现4.48 GOP。

translated by 谷歌翻译

Adherence Forecasting for Guided Internet-Delivered Cognitive Behavioral Therapy: A Minimally Data-Sensitive Approach

Ulysse Côté-Allard , Minh H. Pham , Alexandra K. Schultz , Tine Nordgreen , Jim Torresen

分类：机器学习

2022-01-11

互联网交付的心理治疗（IDPT）被视为一种有效且可扩展的途径，以改善心理医疗保健的可达性。在这种情况下，由于更加传统的干预措施，因此由于医疗保健专业人员与患者之间的互动减少而应对地址的挑战是特别相关的挑战。同时，使用人民个人数据时，尤其是在数字球体中的越来越多的规定。在此类规定中，数据最小化通常是核心租户，例如在一般数据保护条例（GDPR）内。因此，这项工作提出了一种深入学习方法来执行自动遵守预测，同时仅依赖于最敏感的登录/注销数据。该方法在包含接受互联网交付的认知行为治疗（G-ICBT）治疗的342名患者的数据集上进行测试。当仅经过1/3的治疗持续时间，所提出的自我注意网络实现了超过70％的平均平衡准确性。因此，本研究表明，G-ICBT的自动遵守预测，只能使用最小敏感的数据来实现，从而促进了在现实世界IDPT平台中实现了这些工具。

translated by 谷歌翻译